Notre projet porte sur la représentation des Airbnb au sein de grandes villes européennes, plus particulièrement sur le prix de location des biens imobiliers renseignés sur l’application. Notre travail comporte deux parties. Dans la première, nous tenterons d’expliquer les différences de prix entre les logements et, dans la deuxième, nous nous intéresserons à la représentation graphique de la répartition des biens.
Nos données proviennent du site kaggle : https://www.kaggle.com/datasets/thedevastator/airbnb-prices-in-european-cities
Nous disposons du prix des locations la semaine et le week-end pour 10 villes européennes.
| prix_moyen | période |
|---|---|
| 270.86 | Semaine |
| 276.33 | Weekend |
Il est clair que les Airbnb sont plus chers le week-end. On cherche alors à quantifier l’influence de plusieurs variables explicatives sur le prix des Airbnb. Plus précisément, nous cherchons les variables qui permettent d’expliquer les différences de prix entre la semaine et le week-end. Nous avons fait le choix de limiter la taille de l’échantillon car, dans la base de données, il y a une trentaine de logements dont le coût de location dépasse les 8 000€, ce qui compromet la comparaison.
Nous allons à présent modéliser le prix des logements en fonction des variables suivantes:
On observe logiquement que les maisons et les appartements privés sont plus chers que les chambres privées et les chambres partagées. En général, plus un bien est cher en semaine, plus il sera cher le week-end.
D’après les matrices de corrélation, il n’y a pas de différence significative entre les corrélations des variables la semaine et le week-end.
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | 208.0888913 | 24.9287917 | 8.347332 | 0.0000000 |
| room_typePrivate room | -100.1301521 | 5.1665056 | -19.380633 | 0.0000000 |
| room_typeShared room | -176.1526713 | 24.9145960 | -7.070260 | 0.0000000 |
| person_capacity | 3.7584001 | 2.3031164 | 1.631876 | 0.1027176 |
| host_is_superhostTrue | -36.9849807 | 5.0332327 | -7.348156 | 0.0000000 |
| cleanliness_rating | -4.4837857 | 3.1759480 | -1.411794 | 0.1580223 |
| bedrooms | 85.9268580 | 4.2098371 | 20.410970 | 0.0000000 |
| guest_satisfaction_overall | 0.5108604 | 0.3369012 | 1.516351 | 0.1294426 |
| metro_dist | -31.9233201 | 3.0961241 | -10.310737 | 0.0000000 |
| dist | 6.2195975 | 1.0834416 | 5.740593 | 0.0000000 |
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | 237.0565123 | 20.5103482 | 11.5578980 | 0.0000000 |
| room_typePrivate room | -90.7245344 | 4.2507808 | -21.3430281 | 0.0000000 |
| room_typeShared room | -165.4936406 | 20.4986686 | -8.0733849 | 0.0000000 |
| person_capacity | 3.2180134 | 1.8949061 | 1.6982443 | 0.0894735 |
| host_is_superhostTrue | -41.2353827 | 4.1411295 | -9.9575206 | 0.0000000 |
| cleanliness_rating | 1.9060316 | 2.6130348 | 0.7294322 | 0.4657438 |
| guest_satisfaction_overall | -0.2504983 | 0.2771879 | -0.9037127 | 0.3661561 |
| bedrooms | 74.3852759 | 3.4636747 | 21.4758264 | 0.0000000 |
| metro_dist | -32.1767754 | 2.5473590 | -12.6314254 | 0.0000000 |
| dist | 5.9211076 | 0.8914096 | 6.6424095 | 0.0000000 |
Le type de chambre, la confiance qu’ont les utilisateurs envers le propriétaire, le nombre de chambres, la distance au métro et la distance au centre ville expliquent de manière significative, au niveau 0.1%, le prix du logements la semaine. On fait le même constat pour le week-end et on observe également que le nombre de personnes pouvant loger dans l’appartement est une variable significative au niveau 10%. On peut penser que les familles et les groupes d’amis ont plutôt tendance à réserver des logements le week-end.
On peut réaliser une analyse de variance (ANOVA) pour déterminer si les prix moyens des logements diffèrent selon les différentes modalités des variables room_type ou de host_is_superhost.
On observe une légère différence de prix pour les maisons et les appartements privés selon que le propriétaire ait été reconnu comme quelqu’un de confiance par les utilisateurs ou pas. Quelque soit la période, ces biens ont tendance a être moins chers lorsque le propriétaire a été reconnu comme une personne de confiance.
Aucune caractéristique ne semble plus importante que les autres quand il s’agit d’expliquer la différence de prix des Airbnb entre la semaine et le weekend.
Pour illustrer nos données, nous avons réalisé une application sur R Shiny présentant une carte intéractive réalisée avec le package leaflet. Nous avons fait un zoom sur l’Europe occidentale et nous avons représenté les clusters des locations disponibles sur Airbnb dans les 10 villes de notre base de données. Les pays sont colorés en fonction du prix moyen des locations et chaque bien est coloré en fonction de son prix. Nous avons ajouté un filtre permettant de zoomer sur la ville du pays sélectionné, un bouton pour choisir la période, ainsi qu’une barre de pricing permettant de sélectionner une fourchette de prix. Nous avons également ajouté un histogramme représentant la répartition des Airbnb en fonction du prix. L’histogramme s’adapte à la sélection.